- OCR-Software
- OCR-Software,Software, die in der Lage ist, gedruckte Zeichen (Buchstaben, Zahlen, Sonderzeichen) zu erkennen und in digitalen Text umzuwandeln, sodass er, beispielsweise mit einem Textprogramm, weiterbearbeitet werden kann. Die Zeichen werden üblicherweise mit einem Scanner durch Abtasten der unterschiedlichen Helligkeitswerte erfasst und vom Programm unter Ausnutzung von Methoden der Mustererkennung als ANSI-Zeichen ausgegeben (OCR). Voraussetzung dafür, dass ein brauchbares Ergebnis erzielt wird, ist zum einen eine nicht zu schlechte Qualität der Vorlage (u. a. sollte der Kontrast hoch genug sein) und zum anderen, dass das Programm über mehrere Wörterbücher in verschiedenen Sprachen verfügt, die zur Zeichenerkennung herangezogen werden können. Bei bekannter Sprache kann das Programm das komfortable Omnifont-Verfahren anwenden. Die Erkennungsrate (also der Anteil der richtig wiedergegebenen Zeichen am Gesamttext) liegt bei guter OCR-Software zwischen 90 und 95 %. Einige Programme können trainiert werden, d. h., anhand von einigen Probeseiten eines längeren Texts (nur dann lohnt sich der Aufwand) wird dem Programm durch manuelle Korrektur von Fehlern beigebracht, welche Besonderheiten die Buchstabenformen haben. Dadurch lässt sich die Erkennungsrate auf über 95 % steigern. Moderne OCR-Software ist darüber hinaus in der Lage, Layout (z. B. mehrspaltige Texte oder Tabellen und Formulare, ja sogar mathematische Formeln) zu erkennen und zu reproduzieren. Gute OCR-Programme sind beispielsweise OmniPage (von Caere), TextBridge (von Xerox) und FineReader (von Abbyy).
Universal-Lexikon. 2012.